本篇將帶大家爬取每日收盤價,有更細緻資料可以預測到每日的股價
import requests
from io import StringIO
import pandas as pd
import numpy as np
# 設定爬取日期
datestr = '20180131'
# 下載股價
r = requests.post('https://www.twse.com.tw/exchangeReport/MI_INDEX?response=csv&date=' + datestr + '&type=ALL')
# 整理資料,變成表格
df = pd.read_csv(StringIO(r.text.replace("=", "")),
header=["證券代號" in l for l in r.text.split("\n")].index(True)-1)
# 整理一些字串:
df = df.apply(lambda s: pd.to_numeric(s.astype(str).str.replace(",", "").replace("+", "1").replace("-", "-1"), errors='coerce'))
完整抓取區間範例請參考
股價預測篇-爬蟲part5(金融類)